35 research outputs found
Parallel texts alignment
Trabalho apresentado no âmbito do Mestrado em Engenharia Informática, como requisito parcial para obtenção do grau de Mestre em Engenharia InformáticaAlignment of parallel texts (texts that are translation of each other) is a required step for many applications that use parallel texts, including statistical machine translation, automatic extraction of translation equivalents, automatic creation of concordances, etc.
This dissertation presents a new methodology for parallel texts alignment that departs from previous work in several ways. One important departure is a shift of goals concerning the use of lexicons for obtaining correspondences between the texts. Previous methods try to infer a bilingual lexicon as part of the alignment process and use it to obtain correspondences between the texts. Some of those methods can use external lexicons to complement the inferred one,
but they tend to consider them as secondary. This dissertation presents several arguments supporting the thesis that lexicon inference should not be embedded in the alignment process. The method described complies with this statement and relies exclusively on externally managed lexicons to obtain correspondences. Moreover, the algorithms presented can handle very large lexicons containing terms of arbitrary length.
Besides the exclusive use of external lexicons, this dissertation presents a new method for obtaining correspondences between translation equivalents found in the texts. It uses a decision criteria based on features that have been overlooked by prior work.
The proposed method is iterative and refines the alignment at each iteration. It uses the
alignment obtained in one iteration as a guide to obtaining new correspondences in the next iteration, which in turn are used to compute a finer alignment. This iterative scheme allows the method to correct correspondence errors from previous iterations in face of new information
Translation Alignment and Extraction Within a Lexica-Centered Iterative Workflow
This thesis addresses two closely related problems. The first, translation alignment, consists of identifying bilingual document pairs that are translations of each other within
multilingual document collections (document alignment); identifying sentences, titles,
etc, that are translations of each other within bilingual document pairs (sentence alignment); and identifying corresponding word and phrase translations within bilingual
sentence pairs (phrase alignment). The second is extraction of bilingual pairs of equivalent word and multi-word expressions, which we call translation equivalents (TEs), from sentence- and phrase-aligned parallel corpora.
While these same problems have been investigated by other authors, their focus has
been on fully unsupervised methods based mostly or exclusively on parallel corpora.
Bilingual lexica, which are basically lists of TEs, have not been considered or given enough importance as resources in the treatment of these problems. Human validation of TEs, which consists of manually classifying TEs as correct or incorrect translations, has also not been considered in the context of alignment and extraction. Validation strengthens the importance of infrequent TEs (most of the entries of a validated lexicon) that otherwise would be statistically unimportant.
The main goal of this thesis is to revisit the alignment and extraction problems in the
context of a lexica-centered iterative workflow that includes human validation. Therefore, the methods proposed in this thesis were designed to take advantage of knowledge accumulated in human-validated bilingual lexica and translation tables obtained by unsupervised methods. Phrase-level alignment is a stepping stone for several applications, including the extraction of new TEs, the creation of statistical machine translation systems, and the creation of bilingual concordances. Therefore, for phrase-level alignment, the higher accuracy of human-validated bilingual lexica is crucial for achieving higher quality results in these downstream applications.
There are two main conceptual contributions. The first is the coverage maximization
approach to alignment, which makes direct use of the information contained in a lexicon, or in translation tables when this is small or does not exist. The second is the introduction of translation patterns which combine novel and old ideas and enables precise and productive extraction of TEs. As material contributions, the alignment and extraction methods proposed in this thesis have produced source materials for three lines of research, in the context of three PhD theses (two of them already defended), all sharing with me the supervision of my advisor. The topics of these lines of research are statistical machine translation, algorithms and data structures for indexing and querying phrase-aligned parallel corpora, and bilingual lexica classification and generation. Four publications have resulted directly from the work presented in this thesis and twelve from the collaborative lines of research
Artefactos do Paleolítico superior da Gruta do Escoural (Montemor-o-Novo, Évora)
A colecção de artefactos agora dada a conhecer, demonstra a presença de actividade humana, durante o Paleolítico superior, no interior da Gruta do Escoural, aspecto que as manifestações artísticas ali descobertas, de carácter mágico-religioso, bem confirmam.A sua atribuição ao Paleolítico superior, mais especificamente ao Solutrense superior, conforme indica a morfologia do fragmento da "folha de salgueiro" e, eventualmente, ao Magdalenense final, a atendermos aos paralelos que sustentam tanto os fragmentos de zagaia,como a falange de Cervus perfurada ou talvez, ainda, a conta de Littorina obtusata, acompanha a cronologia conferida ao santuário rupestre. A escassez de indústrias atribuíveis ao Paleolítico superior deve-se ao facto de as zonas interiores das cavidades subterrâneas não terem sido habitualmente habitadas pelo Homem que, em certos casos e como aconteceu na Gruta do Escoural, as elegeram para cenário de actividades conotadas com a superstrutura sagrada e de que tanto as pinturas como as gravuras ali detectadas como, possivelmente, os artefactos agora publicados são testemunho.info:eu-repo/semantics/publishedVersio
Dois artefactos de osso, pós-paleolíticos, da Gruta do Escoural (Montemor-o-Novo, Évora)
O estudo dos dois artefactos ósseos, agora dados a conhecer, provenientes da Gruta do Escoural, permite considerar uma ocupação daquela cavidade natural durante o Neolítico final, como indica a tipologia do alfinete, possivelmente dando continuidade à necrópole ali instalada anteriormente (Neolítico médio). A este mesmo período pertencerão, ainda, alguns vasos de cerâmica, nomeadamente um esférico com carena alta.info:eu-repo/semantics/publishedVersio
Desilusão
ARTE E CULTURA VISUAL é uma revista do Centro de Investigação e de Estudos em Belas-Artes (CIEBA), com a periodicidade de um número anual, a sair no final de cada ano. O âmbito a que se dedica é, como o título faz antever, as artes plásticas e a cultura visual, procurando um discurso reflexivo, diverso, actual, problematizante e orgânico, que permita conferir enfoque aos dispositivos da arte e das imagens artísticas na sua ontologia e nos seus contextos – pontuais ou sistémicos – históricos, culturais, estéticos, institucionais, sociais, e, inclusivamente, económicos e políticos. Centrando- se neste campo de pensamento – e as imagens assumem também uma forma de pensamento –, a revista convoca pensadores pluridisciplinares e artistas que desejem partilhar a sua reflexão e a sua obra. Cada número é dedicado a um tema. Este número é dedicado à DESILUSÃO. Desilusão reporta-se a uma sensação de desapontamento, a um sentimento de frustração ou de decepção. Naturalmente, que este desapontamento implica que antes a si existiu, de alguma forma, uma expectativa, eventualmente uma ilusão, que, por conseguinte, não foi cumprida. Depois do alívio da pandemia, de repente, a guerra foi outra. A Rússia invadia a Ucrânia em Fevereiro. Perdem-se vidas, comentem-se abusos de variada ordem. A guerra seguiu-se à peste, como se voltássemos à Idade Média, a um lugar que nos parecia distante, superado. A desilusão pode, contudo, não se limitar à guerra. Este número de Arte e Cultura Visual procura explorar e interpelar este conceito na sua plural abrangência e significado.info:eu-repo/semantics/publishedVersio
Literacia em saúde mental de adolescentes e jovens: Conceitos e desafios
A literacia em saúde entendida enquanto constelação de competências cognitivas, sociais e capacidades que permitem aos
indivíduos aceder, compreender e usar informação no domínio da saúde, tem ao longo da última década sido perspetivada
como dimensão fundamental para os programas de promoção da saúde e prevenção das doenças mentais. Neste artigo
é apresentado e analisado criticamente o conceito de literacia em saúde e literacia em saúde mental, discutindo a sua
abrangência e aplicabilidade, de acordo com os desafios emergentes e que se colocam aos programas de educação e
sensibilização para a saúde mental de adolescentes e jovens. Porque a literacia tem tanto de relevância quanto de
complexidade (Nutbeam, 2009), apresenta-se também um modelo de literacia em saúde, bem como os principais conceitos
com este relacionado, nomeadamente: educação para a saúde, promoção da saúde e comunicação em saúde. Debate-se
ainda a extensibilidade desta temática no âmbito das novas ferramentas ao serviço da promoção da saúde como é o caso
da web e do seu potencial e utilidade no incremento da literacia em saúde mental de adolescentes e jovens.ABSTRACT: Health literacy, understood as a constellation of cognitive and social skills
and competences that allow individuals to access, understand and use
information in the health domain, has been, during the last decade,
viewed as a fundamental dimension of health promotion and mental
illness prevention programmes. In this article, the health literacy concept
and mental health literacy are presented and critically analyzed, discussing
their scope and applicability, in terms of the emerging challenges that
are placed on mental health education and sensitization programs for
teenagers and young people. Because literacy is as relevant as it is complex
(Nutbeam, 2009), a health literacy model is also presented, as well as
the principal concepts related to it, namely: health education, health
promotion and health communication. The extension of this theme to the
area of new tools at the service of health promotion is also debated, as in
the case of the Web and its potential and utility in increasing the mental
health literacy of teenagers and young people.RESUMEN: La literacía de la salud se entiende como siendo el conjunto
de habilidades cognitivas, sociales y capacitaciones que les
permiten a las personas acceder, comprender y utilizar la
información en el área de la salud. Esta ha sido enfocada
en la última como siendo una dimensión fundamental en
los programas de promoción de la salud y de prevención
de enfermedades mentales. Este artículo presenta y analiza
críticamente el concepto de literacía de la salud y de la
salud mental, y razona su alcance y su aplicabilidad, en
consonancia con los desafíos emergentes y aquellos que se
les colocan a los programas de educación y sensibilización
sobre la salud mental de adolescentes y jóvenes. Ya que
la literacía tiene tanta importante como complejidad
(Nutbeem, 2009), se presenta también un modelo de
literacía de la salud, así como aquellos conceptos clave
relacionados con ella, es decir: la educación para la salud,
la promoción y la comunicación de la salud. Se cuestiona,
asimismo, la capacidad de ampliación de esta cuestión en
el contexto de las nuevas herramientas para la promoción
de la salud, tales como Internet, y su potencial y utilidad en
la mejora de los conocimientos sobre la salud mental de los
adolecentes y jóvenes
Mapping density, diversity and species-richness of the Amazon tree flora
Using 2.046 botanically-inventoried tree plots across the largest tropical forest on Earth, we mapped tree species-diversity and tree species-richness at 0.1-degree resolution, and investigated drivers for diversity and richness. Using only location, stratified by forest type, as predictor, our spatial model, to the best of our knowledge, provides the most accurate map of tree diversity in Amazonia to date, explaining approximately 70% of the tree diversity and species-richness. Large soil-forest combinations determine a significant percentage of the variation in tree species-richness and tree alpha-diversity in Amazonian forest-plots. We suggest that the size and fragmentation of these systems drive their large-scale diversity patterns and hence local diversity. A model not using location but cumulative water deficit, tree density, and temperature seasonality explains 47% of the tree species-richness in the terra-firme forest in Amazonia. Over large areas across Amazonia, residuals of this relationship are small and poorly spatially structured, suggesting that much of the residual variation may be local. The Guyana Shield area has consistently negative residuals, showing that this area has lower tree species-richness than expected by our models. We provide extensive plot meta-data, including tree density, tree alpha-diversity and tree species-richness results and gridded maps at 0.1-degree resolution